Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.00 vteřin. 
Detekce hlasové aktivity
Mitáček, Štěpán ; Pfeifer, Václav (oponent) ; Míča, Ivan (vedoucí práce)
Tato práce se zabývá porovnáváním různých metod detekce řeči z různých zvukových nahrávek. Při porovnávání posuzuje jak výšku nastaveného prahu při rozhodování, tak velikost jednotlivých segmentů, na které se zvuková nahrávka rozloží. Detekce jednotli- vých nahrávek se může lišit v různých řečnících, tak i zda se v nahrávce vyskytuje ruch nebo ne. Závěrem by mělo být porovnání, která z odskoušených metod je nejpřesnější.
Personal Voice Activity Detection
Sedláček, Šimon ; Landini, Federico Nicolás (oponent) ; Švec, Ján (vedoucí práce)
This work aims to implement, test, and evaluate a speaker-conditioned Voice Activity Detection (VAD) method called Personal VAD. The method builds upon an LSTM-based approach to VAD and its purpose is to introduce a system that can reliably detect speech of a target speaker, while retaining the typical characteristics of a VAD system, mainly in terms of small model size, low latency, and low necessary computational resources. The system is trained to distinguish between three classes: non-speech, target speaker speech, and non-target speaker speech. For this purpose, the method utilizes speaker embeddings as a part of the input feature vector to represent the target speaker. Some of the more heavyweight personal VAD variants also make use of speaker verification scores issued to each frame based on the target embedding, resulting in a more robust system. In addition to the one scoring method presented in the original article, two other scoring approaches are introduced, both outperforming the baseline method and improving the performance even for acoustically challenging conditions.
Personal Voice Activity Detection
Sedláček, Šimon ; Landini, Federico Nicolás (oponent) ; Švec, Ján (vedoucí práce)
This work aims to implement, test, and evaluate a speaker-conditioned Voice Activity Detection (VAD) method called Personal VAD. The method builds upon an LSTM-based approach to VAD and its purpose is to introduce a system that can reliably detect speech of a target speaker, while retaining the typical characteristics of a VAD system, mainly in terms of small model size, low latency, and low necessary computational resources. The system is trained to distinguish between three classes: non-speech, target speaker speech, and non-target speaker speech. For this purpose, the method utilizes speaker embeddings as a part of the input feature vector to represent the target speaker. Some of the more heavyweight personal VAD variants also make use of speaker verification scores issued to each frame based on the target embedding, resulting in a more robust system. In addition to the one scoring method presented in the original article, two other scoring approaches are introduced, both outperforming the baseline method and improving the performance even for acoustically challenging conditions.
Detekce hlasové aktivity
Mitáček, Štěpán ; Pfeifer, Václav (oponent) ; Míča, Ivan (vedoucí práce)
Tato práce se zabývá porovnáváním různých metod detekce řeči z různých zvukových nahrávek. Při porovnávání posuzuje jak výšku nastaveného prahu při rozhodování, tak velikost jednotlivých segmentů, na které se zvuková nahrávka rozloží. Detekce jednotli- vých nahrávek se může lišit v různých řečnících, tak i zda se v nahrávce vyskytuje ruch nebo ne. Závěrem by mělo být porovnání, která z odskoušených metod je nejpřesnější.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.